package com.ibm.html;

import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.PrintWriter;

import org.w3c.tidy.Tidy;

public class HtmlProcessor {

	private static String properties = "config/jTidy.properties";
	private static String errorMessage = "files/Jtidy_Error_Message.txt";

	public void JtidyProcessor(String inputPath, String outputPath) {
		try {
			System.out.println("Html：Html 转换为 xml ");
			Tidy tidy = new Tidy(); // 使用Jtidy几乎只需要用的这一个类

			// 设置jtidy的配置文件，当然你也可以在程序根据需要中设置
			tidy.setConfigurationFromFile(properties);

			// 输出错误与警告信息,默认输出到stdout
			tidy.setErrout(new PrintWriter(errorMessage));

			// 需要转换的文件，当然你也可以转换URL的内容
			FileInputStream in = new FileInputStream(inputPath);

			// 输出的文件
			FileOutputStream out = new FileOutputStream(outputPath);

			// tidy.getConfiguration().printConfigOptions(new
			// PrintWriter(System.out),true);

			// 开始转换, Jtidy把所有东西都封装好
			tidy.parse(in, out);

			// 转换完成关闭输入输出流
			out.close();
			in.close();
			
			System.out.println("Html：Html 转换为 xml 完成 ");
		} catch (Exception e) {
			System.out.println(e.getMessage());
		}
	}
}
